ارائه یک روش جدید بازیابی اطلاعات مناسب برای متون حاصل از بازشناسی گفتار

thesis
abstract

در این پایان نامه، یک پیش پردازش برای روشهای بازیابی اطلاعات، ارائه می شود، که برای بازیابی اطلاعات حاصل از متون بازشناسی شده ی گفتاری، مناسب است. ورودیهای مسئله اسناد متنی بدست آمده از بازشناسی گفتار و پرس و جو است. هدف یافتن اسناد مرتبط می باشد. مشکل این است که متن حاصل از بازشناسی گفتار، همواره دارای درصدی خطا در بازشناسی است که موجب می شود، بازیابی به خوبی عمل نکرده و اسناد مرتبط تشخیص داده نشوند. ایده ی این روش، تشخیص خطای بازشناسی در کلمات و در نظر گرفتن کلمات مشابه برای آن دسته از کلماتی که به عنوان خطا تشخیص داده شده اند، می-باشد. برای تشخیص کلمه ی خطا، پارامتری به عنوان احتمال خطا در کلمه تعریف شد که بزرگ بودن آن بیانگر امکان بیشتر وقوع خطا در کلمه است. برای تشخیص کلمات مشابه، ابتدا کلماتی از واژگان را بر اساس فاصله ای به نام فاصله ی لونشتاین فیلتر می نماییم. سپس احتمال تبدیل را در کلمات باقی مانده محاسبه می کنیم. در نهایت، کلمات مشابه، از بین کلماتی که احتمال تبدیل بیشتری دارند، بر اساس یک سطح آستانه انتخاب می شود. نتایج پیاده سازی نشان دهنده ی بهبود قابل ملاحظه ای در روش های بازیابی، با در نظر گرفتن این پیش پردازش می باشد.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

ارائه یک روش جدید بازیابی اطلاعات مناسب برای متون حاصل از بازشناسی گفتار

In this article a pre-processing method is introduced which is applicable in speech recognized texts retrieval task. We have a text corpus, t generated from a speech recognition system and a query as inputs,  to search queries in these documents and find relevant documents. A basic problem in a typical speech recognized text is some error percentage in recognition. This, results erroneously ass...

full text

ارائه روشی جدید برای شاخص‌گذاری خودکار و استخراج کلمات کلیدی برای بازیابی اطلاعات و خوشه‌بندی متون

Persian words in writing with a diverse and cover all modes of grammatical words with the recruitment of a series of specific rules because it is impossible to extract keywords automatically from Persian texts difficult and complex. This thesis has attempted to use linguistic information and thesaurus, keywords Mnatry be provided. Using the symbol system is structured network can be keywords, i...

full text

ارائه روشی جدید برای شاخص گذاری خودکار و استخراج کلمات کلیدی برای بازیابی اطلاعات و خوشه بندی متون

در زبان فارسی کلمات دارای صورت های نگارشی متنوعی هستند و پوشش کلیه حالات دستوری کلمات با به کارگیری یک سری قواعد معین ناممکن است به همین دلیل استخراج کلمات کلیدی به طور خودکار از متون فارسی دشوار و پیچیده است. در این مقاله سعی شده است با استفاده از اطلاعات زبان شناختی و اصطلاح نامه ، کلمات کلیدی بامعناتری ارائه شود. با استفاده از اصطلاح نامه که از نظامی ساختارمند برخوردار است می توان شبکه کلمات...

full text

طراحی یک روش آموزش ناموازی جدید برای تبدیل گفتار با عملکردی بهتر از آموزش موازی

Introduction: The art of voice mimicking by computers, has with the computer have been one of the most challenging topics of speech processing in recent years. The system of voice conversion has two sides. In one side, the speaker is the source that his or her voice has been changed for mimicking the target speaker’s voice (which is on the other side). Two methods of p...

full text

روش های اتصال گرای جدید بر گرفته از سامانه ادراک گفتار انسان به منظور بهبود بازشناسی گفتار ماشینی

بازشناسی خودکار گفتار در شرایط عدم تطابق دادگان آموزش و آزمون، یکی از چالش های مهم در این مورد است. به منظور کاهش هر چه بیشتر این عدم تطابق، روش های مرسوم، سعی در بهسازی گفتار یا تطابق مدل آماری دارند. در این زمینه از جمله روش های دیگر می توان به آموزش مدل در شرایط مختلف اشاره کرد. موفقیت در این روش ها، در مقابل کارایی سیستم درک و بازشناسی در انسان بسیار ابتدایی به نظر می رسد...

full text

ارائه یک ساختار جدید وابسته به بافت برای بازشناسی گفتار پیوسته

این پژوهش، کوششی است برای ارائه یک ساختار وابسته به بافت برای بازشناسی گفتار پیوسته. مدل سازی مستقل از بافت، اثر واج های پیرامون را بر تلفظ هر واج، نادیده می گیرد و به همین دلیل، برای مدل سازی هر واج، همه نمونه های آموزشی مربوط به آن واج را در نظر می گیرد. در نظر گرفتن اثر بافت در مدل سازی، می تواند خطای بازشناسی را تا حد زیادی کاهش دهد. این پایان نامه با در نظر گرفتن واحد آوایی سه واجی، واج ها...

15 صفحه اول

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده علوم پایه مهندسی

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023